数据集科幻影视_第2页

打造图像编辑领域的ImageNet？苹果用Nano Banana开源了一个超大数据集

在文本引导的图像编辑的工作中，GPT4-o 和谷歌 Nano-banana 都能够实现令人惊艳的编辑效果，保留原图像的特征，实现高质量的新图像的生成。尤其是 Nano-banana，真正能被成为图像编辑的里程碑和新标杆。

图像编辑数据集 nano banana nanobanan 2025-10-26 12:03 6

海洋所牵头申报，这项成果入选国家首批高质量数据集典型案例

青岛日报社/观海新闻10月23日讯近日，国家数据局发布首批《高质量数据集典型案例》名单，由中国科学院海洋研究所牵头，联合中国科学院大气物理研究所、中国科学院南海海洋研究所共同申报的“全球海洋环境变化关键参数高质量数据集”入选。

数据集青岛日报李勋二氧化碳分压海洋所 2025-10-23 15:27 8

上海交大突破：AI实现任务指令驱动场景生成

这项由上海交通大学的郝锦坤、上海人工智能实验室的梁乃富和许旭东等研究人员组成的团队在2025年9月发表的研究，首次提出了一个革命性的解决方案。该论文发表在计算机视觉顶级会议上，论文编号为arXiv:2509.22281v1，为机器人训练开辟了全新道路。

推理机器人数据集室内设计师 mesatask 2025-10-21 21:43 32

莫斯科大学突破：普通照片实现房间结构与物品识别

这项突破性研究由莫斯科国立罗蒙诺索夫大学、俄罗斯高等经济学院以及亚美尼亚力学研究所的联合团队完成，第一作者是安东·科努申（Anton Konushin），通讯作者是达尼拉·鲁霍维奇（Danila Rukhovich）。这项名为"TUN3D: Towards R

照片 f1 数据集莫斯科大学 tun3d 2025-10-21 22:28 8

微软研究院突破：让AI真正读懂多种语言的文化密码

在全球化快速发展的今天，人工智能正在成为连接不同语言和文化的重要桥梁。然而，现有的AI系统往往存在一个令人困扰的问题：它们在英语世界表现出色，但一旦面对其他语言，特别是那些资源相对稀缺的语言时，就显得力不从心。这项由微软公司的Pranjal A. Chital

微软研究院数据集 updesh updesh数据集 2025-10-21 22:29 8

机器人界的PyTorch来了！Hugging Face 联合牛津团队发布LeRobot库

近日，Hugging Face 联合英国牛津大学团队发布了 LeRobot，这是一个旨在与整个机器人技术栈实现端到端集成的开源库，业内将其称为是「机器人界的 PyTorch」。LeRobot 支持机器人从大规模多模态数据比如文本、视频和传感器中学习，适配于多种

机器人牛津数据集 pytorch lerobot 2025-10-20 21:54 13

InteractMove：3D场景中人与可移动物体交互动作生成新框架

该论文的第一作者和通讯作者均来自北京大学王选计算机研究所，第一作者为博士生蔡鑫豪，通讯作者为博士生导师刘洋。团队近年来在 TPAMI、IJCV、CVPR、ICML 等顶会上有多项代表性成果发表，多次荣获国内外多模态理解与生成竞赛冠军，和国内外知名高校、科研机构

模型可视化交互数据集 interactmove 2025-10-20 17:44 8

浙数文化获浙报集团媒体数据使用授权将积极探索高质量数据集建设和大模型研发应用

近日，浙江日报报业集团与浙报数字文化集团股份有限公司正式签署《数据使用授权协议》。浙数文化获浙报集团所有媒体自成立以来的全部媒体内容数据资源使用授权。媒资数据主要指浙报集团各媒体采集和刊发的文字、图片、视频影像数据等，包括超10亿条历史存量数据和后续采集和生产

媒体模型应用数据集媒资 2025-09-22 16:20 7

从实验室到场景应用，具身智能产业加速“破局”

从政策支持到技术创新，从标准制定到产品落地……当前，具身智能机器人产业正以蓬勃之势快速发展。在长三角，多座城市依托政策支持、技术积累与产业生态优势，正加速推动具身智能从实验室走向规模化应用。发力标准化建设，构建产业生态“地基”据相关研究机构预测，到今年年底，我

应用智能实验室数据集何建华 2025-10-17 20:21 6

AI 越“深度学习”越瞎？给它装个“高频眼镜”，立马看清细节！

现在大火的视觉Transformer模型，层数堆多了确实能“全局掌控”，可一到分割图像、检测物体，边缘细节反倒越来越糊。

眼镜深度学习数据集低通滤波器 vit 2025-10-17 16:03 10

阿里Tree-GRPO：AI实现人类式决策思考

这项由阿里巴巴集团AMAP团队的季宇翔、马子瑜等研究人员以及厦门大学、南方科技大学学者共同完成的研究发表于2025年1月，论文编号为arXiv:2509.21240v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

模型智能体推理数据集多跳 2025-10-17 06:27 8

顶刊新发！上海交大提出PreCM：即插即用的旋转等变卷积，显著提升分割模型鲁棒性

本文针对语义分割模型因图像方向任意性导致性能下降的难题，提出了一种即插即用的基于填充的旋转等变卷积模式（PreCM）。该模块基于严谨的群论推导，能直接替换现有网络中的卷积层，使其获得严格的旋转等变性，从而显著提升模型在旋转干扰下的鲁棒性与分割精度。>>更多资讯

模型数据集卷积 coovally precm 2025-10-16 11:09 8

报名开启：揭榜四大赛道，赢取300万大奖

本次大赛整体设四大赛道，包括数据技术创新赛道、高质量数据集和可信数据空间建设创新赛道、行业大模型创新赛道、工业智能体与具身智能创新赛道。

智能体数据集赛迪工业智能体赛迪传媒 2025-10-15 12:34 7

大同市出台措施促进人工智能产业高质量发展

为充分发挥我市在算力资源及数据标注领域的独特优势，构建“数据—算力—模型—应用”全链条生态，推动人工智能与实体经济深度融合，培育壮大新质生产力，市政府办公室日前印发了关于《大同市促进人工智能产业高质量发展若干措施》的通知。

模型人工智能大同市数据集人工智能产业 2025-10-15 08:59 7

90% 的科学已经丢失这个新的人工智能系统刚刚找回了它们

全球每年产生的科学数据中，高达90%从未得到充分利用就永远消失在实验室的硬盘和文件柜中。这一惊人比例不仅代表着巨大的资源浪费，更意味着无数可能推动人类进步的重要发现被埋没。为了扭转这一局面，开放科学出版商Frontiers于10月13日正式推出了FAIR²数据

人工智能科学数据集脑损伤 frontiers 2025-10-14 20:36 7

南开大学突破视频理解难题:让AI像人一样精准找到视频的关键时刻

在我们日常刷短视频的时候，经常会遇到这样的情况：想要快速找到某个精彩片段，但需要在几分钟甚至几小时的视频中反复拖拽进度条。如果有一个智能助手能够准确理解你的描述，瞬间定位到"那个人开始做饭的时刻"或"球员进球的瞬间"，那该多好！最近，来自南开大学计算机科学学院

视频人工智能数据集南开大学程静 2025-10-14 05:52 9

IIT海德拉巴突破：文化适应数据集解码印度文化

这项由印度理工学院海德拉巴分校自然语言与信息处理实验室的普拉米特·萨胡、马哈拉杰·布拉马和毛嫩德拉·桑卡尔·德萨卡尔三位研究者共同完成的研究，发表于2025年9月的计算语言学顶级会议上。想要深入了解这项研究的读者可以通过论文编号arXiv:2509.17399

数据集 iit 海德拉巴 iit海德拉巴数据集解码 2025-10-14 05:49 9

亚马逊BeepBank-500：简化电子音效研究流程

这项由亚马逊公司西雅图贝尔维尤分部的首席科学家Mandip Goswami独立完成的研究发表于2025年9月23日，研究成果以数据集的形式发布在Zenodo平台，DOI编号为10.5281/zenodo.17172015。有兴趣深入了解的读者可以通过该DOI编

研究亚马逊方波音效数据集 2025-10-14 05:51 10

浙江大学团队创造AI视频角色扮演新突破：让AI从视频中学会&

这项由浙江大学张雪乔、罗亚伟等研究人员完成的研究发表于2025年9月，论文编号为arXiv:2509.15233v1。这是人工智能角色扮演领域的一项开创性工作，有兴趣深入了解的读者可以通过该编号查询完整论文。

纪录片视频浙江大学数据集关键帧 2025-10-13 21:59 7

浙江大学团队推出TINKER：一键搞定3D场景编辑，告别繁琐调试

这项由浙江大学赵灿宇、李晓曼、冯天健、赵智越、陈浩等研究者，以及浙江工业大学沈春华团队合作完成的研究，发表于2025年8月20日的arXiv预印本（编号：arXiv:2508.14811v1），为3D场景编辑带来了革命性突破。感兴趣的读者可以通过该编号查询完整

浙江大学 flux 数据集 dino tinker 2025-10-12 22:37 10